查看原文
其他

寻找 GPT-4o 时代的 “Her ”|海外独角兽 X RTE 社区

拾象 海外独角兽
2024-11-03


OpenAI 在今天终于正式开放了 GPT-4o 的高级语音模式(Advanced Mode),“Her”即将成为现实。


声音是最 LLM 原生的交互方式:AI 快速理解并回应语义,而语音作为最符合人类习惯的沟通方式。随着端到端声音模型落地,模型多模态能力增强、推理成本下降,我们认为围绕 Voice Agent,从硬件到软件产品都会带来爆发机遇。


为了探讨这个领域的前沿技术进展和潜在机会,在今年 10月25日到10 月26日在北京举办的 RTE 2024第十届实时互联网大会上,海外独角兽与 RTE 开发者社区联合出品了 Voice AI 技术专场论坛,聚焦于 Voice AI 领域的关键问题,欢迎来现场与我们交流:

• LLM 对语音生成模型带来的变化?

• 如何理解端到端大模型的优势和挑战?

• Voice AI 实现 human-like 的最后一步是什么?

• 当大模型进化到实时多模态,需要什么技术突破,又会带来什么新玩法?

……



👈 限时免费报名 RTE 大会




Voice AI 重塑交互专场






海外独角兽 X RTE开发者社区 联合出品

海外独角兽和 RTE 开发者社区发起的 Voice AI 专场论坛中,拾象 AI research lead Cage 和声网音频技术负责人陈若非会和通义 CosyVoice、 声网、香港中文大学、标贝科技的语音合成、SpeechGPT 等团队的技术专家齐聚一起,共同探讨 AI 语音交互的前沿话题。









联合出品方介绍



RTE 开发者社区是聚焦实时互动领域的开发者社区。希望通过社区链接领域内的开发者和生态力量,萌芽更多新技术、新场景,探索实时互动领域的更多可能。这里你将遇见一群致力于改变人和人、人和世界,以及人和 AI 连接方式的开发者。



「海外独角兽」是拾象旗下的开源研究平台,专注于研究全球范围最优秀的创新公司,致力于用开源精神重塑投资信息分发网络。创立以来拾象团队积极输出高质量的行业与公司认知,已经输出了近 300 篇针对全球头部科技公司和前沿科技趋势的文章。在全球 AI 社区中积累了行业影响力,全网拥有 20万+订阅,覆盖头部互联网企业界、硅谷 AI 科学家、以及全球科技公司一线从业者。



RTE 2024






技术专场前瞻




点击文末阅读原文,直达报名链接

 延伸阅读



LLM 新范式:OpenAI o1,self-play RL 和 AGI 下半场


草莓模型即将发布,如何参与新一轮 AI 上涨周期?|AGIX 投什么


LLM 进化分叉口:多模态、成本、代码推理


LLM的范式转移:RL带来新的 Scaling Law


Unstructured.io:让企业非结构化数据 LLM-Ready


继续滑动看下一个
海外独角兽
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存